Planification multi-agents dans un cadre markovien : les jeux stochastiques à somme générale

نویسنده

  • Mohamed Amine Hamila
چکیده

Planning agent’s actions in a dynamic and uncertain environment has been exten-sively studied. The framework of Markov decision process provides tools to model andsolve such problems. The field of game theory has allowed the study of strategic inter-actions between multiple agents for a given game. The framework of stochastic games isconsidered as a generalization of the fields of Markov decision process and game theory.It allows to model systems with multiple agents and multiple states.However, planning in a multi-agent system is considered difficult : agent’s decisionsdepend not only on its actions but also on actions of the other agents. The work presentedin this thesis focuses on decision making in distributed multi-agent systems. Existingworks in this field allow the theoretical resolution of stochastic games but place severerestrictions and ignore some crucial problems of the model. We propose a decentralizedplanning algorithm for the model of stochastic games. Our proposal is based on the Value-Iteration algorithm and on the concept of Nash equilibrium. To improve the resolutionprocess and to deal with large problems, we sought to ease decision making and limit theset of joint actions at each stage. The proposed algorithm was validated on a coordinationproblem including several agents and various experiments were conducted to assess thequality of the resulting solution.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A Continuous Time Approach for the Asymptotic Value in Two-Person Zero-Sum Repeated Games

Nous nous intéressons à la valeur asymptotique dans les jeux stochastiques à somme nulle avec une évaluation générale de la suite des paiements d'étapes. Nous montrons l'existence de la valeur asymptotique dans un sens robuste dans les jeux répétés à information incomplète, les jeux de splitting et les jeux absorbants. La technique de preuve consiste (1) à plonger le jeu répété en temps discret...

متن کامل

Apprentissage de la coordination multiagent : Q-learning par jeu adaptatif

Résumé : Dans le cadre de l’apprentissage multiagent, de nombreux travaux ont cherché jusqu’à présent à établir des algorithmes convergents vers un équilibre de Nash en jeux stochastiques. De tels algorithmes sont cependant limités dans la mesure où ils sont incapables de gérer la multiplicité des équilibres de Nash et de converger vers l’équilibre Pareto-optimal si celui-ci existe. Ces algorit...

متن کامل

Les jeux d'accessibilité généralisée

RÉSUMÉ.Dans cet article, nous étudions les jeux d’accessibilité généralisée : ce sont des jeux à deux joueurs à somme nulle, pour lesquels l’objectif du premier joueur, Ève, est donné par une conjonction d’objectifs d’accessibilité. Dans un premier temps, nous montrons que le problème de décider si Ève a une stratégie gagnante est PSPACE-complet, mais polynomial en fixant pour paramètre le nomb...

متن کامل

Réseaux d'automates stochastiques à temps discret

RÉSUMÉ. Les chaînes de Markov facilitent l’analyse des performances des systèmes dynamiques dans de nombreux domaines d’application. Elles sont souvent utilisées par le biais d’un formalisme de haut niveau. Parmi les différents formalismes couramment utilisés, on se place dans le cadre des réseaux d’automates stochastiques (SAN). De nombreux travaux dans ce domaine traitent les systèmes à temps...

متن کامل

Approximations in Dynamic Zero-sum Games, Ii Approximations in Dynamic Zero-sum Games, Ii

We pursue in this paper our study of approximations of values and-saddle-point policies in dynamic zero-sum games. After extending the general theorem for approximation, we study zero-sum stochastic games with countable state space, and non-bounded immediate reward. We focus on the expected average payoo criterion. We use some tools developed in the rst paper, to obtain the convergence of the v...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012